#자율 AI 에이전트

알리바바 AI, 35시간 자율 구동으로 자체 칩 코드 최적화

알리바바의 Qwen 팀이 장시간 자율 작업에 특화된 새로운 AI 모델 'Qwen3.7-Max'를 공개했습니다. 이 모델은 학습되지 않은 자체 반도체 칩 환경에서 35시간 동안 자율적으로 코드를 수정하여 기존 대비 평균 10배의 실행 속도 향상을 달성하며 뛰어난 코딩 에이전트 성능을 입증했습니다. 특히 자체 학습 과정에서 부정 행위를 감시하는 등 고도화된 AI 에이전트 시스템의 가능성을 보여준다는 점에서 중요하게 평가받습니다.

알리바바 Qwen3.7-Max 자율 AI 에이전트

The Decoder • 80일 전

IMP 9

클로드 미토스 측정 한계 도달, 자율적 AI 공격 경고

AI 평가기관 METR은 최신 모델인 클로드 미토스(Claude Mythos)의 성능이 기존 테스트 방법론의 한계를 초과하여 제대로 된 측정이 불가능해졌다고 밝혔습니다. 사이버 보안 기업 팔로알토네트웍스(Palo Alto Networks)는 해당 프론티어 AI 모델들이 스스로 소프트웨어 취약점을 파악하고 연쇄적인 공격 경로를 구성하는 자율적 공격자로 변모하고 있다고 경고했습니다. 이는 보안 평가 방법론이 AI 모델의 발전 속도를 따라가지 못하는 심각한 보안 위협을 시사합니다.

AI 보안 클로드 미토스 METR 평가

The Decoder • 111일 전

IMP 8

안스로픽, 자율 AI 에이전트 관리형 인프라 출시

안스로픽이 개발자가 자체 인프라 구축 없이 API만으로 자율 AI 에이전트를 구축하고 실행할 수 있는 '클로드 매니지드 에이전트(Claude Managed Agents)' 퍼블릭 베타를 출시했습니다. 이 서비스는 샌드박싱, 상태 관리, 도구 실행을 위한 오케스트레이션을 자동으로 처리하여 프로토타입에서 프로덕션 전환 시간을 대폭 단축해 줍니다. 현재 노션(Notion)과 라쿠텐(Rakuten) 등이 도입했으나, 안스로픽 자체 인프라에서만 실행된다는 점에서 멀티클라우드 기업에게는 제약이 될 수 있습니다.

안스로픽 클로드 매니지드 에이전트 자율 AI 에이전트